def extract_unique_characters(dataset_file_path):
    unique_characters = set()

    # 读取数据集文件，提取标签中的唯一字符
    with open(dataset_file_path, 'r', encoding='utf-8') as f:
        for line in f:
            # 按制表符分割样本，获取标签部分
            label = line.strip().split(',')[1]
            # 将标签中的字符添加到集合中
            unique_characters.update(label)

    return sorted(list(unique_characters))


# 数据集文件路径
dataset_file_path = 'D:/PycharmProjects/yolo_v8/recognition/labels/data.txt'

# 提取数据集中的唯一字符
unique_characters = extract_unique_characters(dataset_file_path)
# 直接在终端输出结果
print("Unique characters extracted:", unique_characters)
